1.2 可能的输出

1 实验主义视角的因果推断

没有操纵就没有因果. 我们关心什么, 就把什么作为干预的对象. 例如

2 输出结果的记号方式

考虑一个实验有 n 个实验单元: i=1,,n. 令 1 为实验组, 0 为对照组. 对每个单元 i, 它来自两个组中的一个, 所以我们只能观察到 Yi(0),Yi(1) 中的一个.

假设

  • (无干预) i 的可能结构不依赖其他单元
  • (一致性) 实验组的干预方式唯一且确定
  • (SUTVA) 上述两个假设成立.

无干预假设可能会被社交网络或者传染性疾病破坏; 一致性假设可能会被具体的干预的种类影响(例如香烟的品牌, 大学教育的专业等). 我们可以用表格 (潜在结果表, science table) 表示这些结果

i Yi(1) Yi(0)
1 Y1(1) Y1(0)
n Yn(1) Yn(0)

定义 因果效应(causal effect) 为 τi=Yi(1)Yi(0). 但是我们只能观测到 Yi(1)Yi(0) 中的一个, 因此直接研究 τi 比较困难. 为此我们首先定义 平均因果效应(ACE, average causal effect) 为 τ=1ni=1n[Yi(1)Yi(0)]=1ni=1nYi(1)1ni=1nYi(0).

2.1 因果效应 子组 Yule-Simpson 悖论的不存在性

如果我们用二元变量 Xi (取值 0,1) 定义两个子组, 可以定义子组的因果效应为 τx=i=1n1{Xi=x}[Yi(1)Yi(0)]i=1n1{Xi=x},x=0,1.
它代表两个子集中因果效应分别的平均值. 如果记 πx=1ni=1n1{Xi=x}, 则 τ=π1τ1+π0τ0. 也即每部分的平均值乘以每部分的占比. 如果 τ1,τ0>0, 则 τ>0, 符号一致, 这说明 Yule-Simpson悖论 不能发生在因果效应这一统计指标中.

2.2 实验单元定义的微妙之处

实验单元和实际的物理单元可以不一样. 例如, 一个人服用阿斯匹林前头痛, 服用后头不痛, 这里实际上是 两个 实验单元 i,beforei,after. 因此我们有四个可能的结果: Yi,before(0)=0,Yi,before(1)=?,Yi,after(0)=?,Yi,after(1)=1. 这里我们观察到两个, 丢失两个. (可能不服药头痛也会消失, 或者服药后头依然痛)

2.3 分配实验组的机制

Zi 是单元 i 的是否分配到实验组的标志, 记 Z=(Z1,,Zn), 则 i 的观测结果是Yi={Yi(1),Zi=1,Yi(0),Zi=0=ZiYi(1)+(1Zi)Yi(0)=Yi(0)+Zi(Yi(1)Yi(0))=Yi(0)+Ziτi.
而与之相对的是缺失结果: Yimis={Yi(0),Zi=1,Yi(1),Zi=0=ZiYi(0)+(1Zi)Yi(1).